Uvod
V projektu je analiza nesreč z rekreativnimi plovili. Deskriptivno so prikazane okoliščine nesreč, analitično pa je vključena še linearna regresija števila smrtnih nesreč v oziru na število registriranih plovil in povprečnega prihodka državljana ZDA. V shiny je še spletna aplikacija, ki prikazuje število nesreč v oziru na okoliščine nesreče.
Spletna povezava do vira tabel za nesreče [pdf], spletna povezava do vira povrečnega prihodka in grob opis podatkov izvlečenih tabel:
2020 Recreational boating statistics
- TABELA: (Nesreče v posameznih mesecih)
- Mesec (faktor)
- Smrtne nesreče (niz)
- Nesmrtne nesreče (niz)
- Vse nesreče (niz)
- Procent smrtnih nesreč (niz)
- Število smrti (stevilo)
- TABELA: (Nesreče v posameznih letij)
- Leto (stevilo)
- Smrtne nesreče (stevilo)
- Nesmrtne nesreče (stevilo)
- Vse nesreče (stevilo)
- TABELA: (Nesreče v posamezni zvezni državi)
- Zvezna država (niz)
- Vse nesreče (stevilo)
- Smrtne nesreče (stevilo)
- Vse nesreče (stevilo)
- Oškodovani (stevilo)
- Število smrti (stevilo)
- Število ponesrečencev (stevilo)
- Škoda v USD (stevilo)
- TABELA: (Število registriranih plovil)
- Leto (stevilo)
- Število smrti (stevilo)
- Število registriranih plovil (stevilo)
- Delež smrtnih izidov (stevilo)
- Število smrti v plovilih z motorjem (stevilo)
- Število registriranih motornih plovil (stevilo)
- Delež smrnih izidov z motornim plovilom (stevilo)
- TABELA: (Prihodek državljana ZDA)
- Leto (stevilo)
- Povprečni prihodek (stevilo)
- TABELA: (Vzrok nesreč)
- Vzrok (faktor)
- Število nesreč (stevilo)
- Število smrti (stevilo)
- Število poškodb (stevilo)
- Tip nesreče (niz)
Vizualizacija podatkov
Na zemljevidu ZDA je prikazano število smrtnih nesreč glede na posamezno zvezno državo.
Graf števila smrti v posameznem mesecu (v letu 2020)
Graf števila smrti v posameznem letu
Za dodatek si oglejmo malo regate
Graf, ki prikazuje povzetek regat “Volvo ocean race” v letih 1973-2018. Sam graf ne pove kaj dosti, osi pa so tudi prisilno postavljene.
Oglejmo si zgornjo regato v letu 2017/18. Na zemljevidu lahko vidimo posamezna kola tekme in okvirno pot (ki včasih skipperja pripelje na kopno 😅.
Regresijska analiza
Grafa števila registriranih plovil in prihodka na prebivalca, ki bosta naši pojasnjevalni količini v regresijskem modelu.
Spodaj vidimo rezultat regresijske analize. Postavimo hipotezo \(H_0: \beta_1 =0\) in spotoma \(H_0: \beta_2 = 0\), kjer se \(\beta_1\) nanaša na število registriranih plovil, \(\beta_2\) pa na prihodek. Iz izhoda vidimo, da \(|t_1| < 1.96, |t_2| > 1.96\), zato ničelno hipotezo za registrirana plovila lahko zavrnemo.
Pod izhodom si oglejmo še diagnostiko predpostavk linearne regresije. \(R^2\) je zelo majhen, kar ni dober znak. Rdeča črta ostankov proti fittanim vrednostim je sicer dobra (ravna okoli 0), a nas motijo same vrednosti (ta preveri samo linearnost podatkov). Drugi in tretji graf sta (morda presentiljo) zadovoljiva.
##
## Call:
## lm(formula = Smrti ~ Prihodek + Registrirane, data = registracije)
##
## Residuals:
## Min 1Q Median 3Q Max
## -86.357 -20.868 -8.334 15.955 100.969
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -9.249e+02 8.168e+02 -1.132 0.273
## Prihodek 3.802e-03 3.062e-03 1.241 0.231
## Registrirane 1.166e-04 5.633e-05 2.070 0.054 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 48.68 on 17 degrees of freedom
## Multiple R-squared: 0.2679, Adjusted R-squared: 0.1817
## F-statistic: 3.11 on 2 and 17 DF, p-value: 0.07065
Omenimo, da bi lahko pri linearni regresiji eliminirali trend pri prihodku na prebivalca, da bi to spremenljivko logaritmirali. S tem pristopom ničelne hipoteze tudi za število registriranih plovil ne moremo zavrniti.